成人无码网www在线观看-久激情内射婷内射蜜桃-亚洲欧美日韩久久精品-婷婷五月综合激情

聯(lián)
咨詢熱線:

185-9527-1032

聯(lián)系QQ:

2863379292

官方微信:

什么值得買推薦系統(tǒng)思考

建站經(jīng)驗

導讀:A5創(chuàng)業(yè)項目春季招商 好項目招代理無憂時逢年假,把自己對部分場景以及推薦系統(tǒng)的理解整理出來,大多只是提出疑問與簡單思考。一、什么才是好的推薦系統(tǒng)推薦系統(tǒng)要平衡好幾方的

發(fā)表日期:2019-03-18

文章編輯:興田科技

瀏覽次數(shù):9827

標簽:

A5創(chuàng)業(yè)項目春季招商 好項目招代理無憂

時逢年假,把自己對部分場景以及推薦系統(tǒng)的理解整理出來,大多只是提出疑問與簡單思考。

一、什么才是好的推薦系統(tǒng)

推薦系統(tǒng)要平衡好幾方的關系

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

推薦系統(tǒng)三方關系

用戶:接收到有用的、有趣的內(nèi)容; 站方:在不斷的好文推薦中,讓用戶參與其中,升級消費觀念,最終達到轉化率效果; 內(nèi)容提供者:內(nèi)容的參與度提升,曝光度增加,鼓勵用戶不斷產(chǎn)生內(nèi)容;

在這三方參與者之間,其實普通用戶才是關鍵。如果用戶在閱讀過程中,無法接收到有用、有趣的內(nèi)容,那站方、內(nèi)容提供者的愿景更是無從實現(xiàn)。什么樣的內(nèi)容才是有用的信息?什么樣的推薦系統(tǒng)才是好的推薦系統(tǒng)?從算法角度講,“精準”是推薦系統(tǒng)的衡量標準,即關聯(lián)相似度。

可是事實真的是這樣嗎? 提出幾個場景:

用戶收藏了一篇關于“家裝”內(nèi)容的文章,就根據(jù)相似度理論不斷推送同類文章。

一周內(nèi)用戶“好價”內(nèi)多次搜索、瀏覽同一關鍵詞,第二周停止搜,用戶是不是已經(jīng)完成購買這一產(chǎn)品了?

用戶在好價內(nèi)搜索“軟毛牙刷”,那好文系統(tǒng)應該推送的是“牙刷測評”還是關聯(lián)”口腔健康“商品的文章呢? ……

推薦系統(tǒng)不僅僅應該只追求“精準”,因為這可能造成兩項誤區(qū):

重復推送,用戶可能已經(jīng)購買過類似商品或者根本對這類文章失去了興趣

用戶本來就打算購買的商品,單一推薦并不能夠增加潛在的消費升級,反而是相似度更小的衍生產(chǎn)品文章,會讓用戶感到新意,同時提高KOI

所以,對于我們的好文推薦系統(tǒng)體系,要完成的不僅僅應該是“精準”,而是在準確識別預測用戶行為的同時,幫助擴展用戶的視野,幫助用戶發(fā)展他們可能感興趣,自己卻并沒有發(fā)現(xiàn)的內(nèi)容。

也就是說,好文推薦系統(tǒng)的場景是極為重要的,應該有懂推薦系統(tǒng)和業(yè)務流程的產(chǎn)品經(jīng)理同時加入到推薦系統(tǒng)團隊

二、理解用戶的行為

分析前,我們首先要關注用戶行為和數(shù)據(jù):

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

用戶數(shù)據(jù)來源

以上全部數(shù)據(jù)都會是判斷用戶行為的來源。那如果訓練一個二進制分類器,首要任務是定義正負樣本,為樣本定義正負標簽絕不是普通任務,聯(lián)系場景考慮,有什么可能存在的坑?

思路有限,我們就單從好價瀏覽內(nèi)容時用戶數(shù)據(jù)入手 先畫一個行為漏斗:

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

行為漏斗

最簡單的思路是:按照行為漏斗的深度對樣本行為設立不同權重,判斷用戶行為偏好,然后進行推薦,可現(xiàn)實場景確實是這樣嗎?

簡單提幾個問題: 1、什么樣的數(shù)據(jù)可以看作正樣本? 2、點擊行為都是正樣本嗎? 3、點“值”是什么想法?“不值”呢? 4、評論行為證明什么?用戶是在提出問題還是回答問題? 5、買過的商品還需要再推送嗎? ……

討論這幾個問題的基礎要回到推薦系統(tǒng)的第一步:理解/獲取用戶需求 那用戶真的需要什么?怎么理解他的行為?

對剛才的問題一個個來討論:(不以詳盡性為目的,只做討論)

1、什么樣的數(shù)據(jù)可以看作正樣本?

行為漏斗中只有“收藏、分享”這兩個動作能被完全看作為正樣本,分享的行為成本還要高于收藏,但是收藏對于推薦系統(tǒng)識別是有很大幫助的,這證明用戶對于這類商品是有興趣的,有潛在的購買需求,這符合我們推薦的基本場景。

2、點擊行為都是正樣本嗎?

所有的不點擊動作都可以看作負樣本,但是對于點擊動作也應該分情況討論。比如:

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

3、點“值”是什么想法?“不值”呢?

交互動作很大一部分發(fā)生在“值/不值”上,但是這個行為是一個很復雜的動作,例如:

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

不同頻次的“點值/不值”動作,很值得我們討論。因為點值行為是值得買平臺內(nèi)中為數(shù)不多的評分反饋,更可能反應了用戶深層次的行為驅動,他真的想要什么?喜歡什么?行為永遠比言語更能反應用戶的內(nèi)心。

4、評論行為證明什么?用戶是在提出問題還是回答問題?

之前的討論里用數(shù)據(jù)分析過評論區(qū)中的內(nèi)容,但是我們分析的是:用戶在討論什么?需要什么?而今天我們除了這個結果以外,我們還需要討論一點:這些用戶是誰?提問者?回答者?他是不是已經(jīng)購買過這個商品了?我們應該更偏向對于提問者推送相關內(nèi)容,因為他們是更潛在的購買者, 對于專家用戶,可能他已經(jīng)對類似內(nèi)容失去興趣了。

5、買過的商品還需要再推送嗎?

不能夠確定值得買平臺有沒有用戶購買數(shù)據(jù)(例如海淘網(wǎng)站返利成功數(shù)據(jù)),如果存在這個數(shù)據(jù)庫的話,這完全能夠用戶是否購買過這個產(chǎn)品。如果沒有的話,只能從用戶深層的行為來判斷他是不是購買過這個產(chǎn)品了。

三、推薦場景思考

當理解用戶行為之后,開始推薦系統(tǒng)第二步:滿足用戶需求,用算法做推薦。

大部分電商網(wǎng)站現(xiàn)在都采取了較為成熟完善的協(xié)同過濾算法,作為推薦系統(tǒng)的主體。同時也采用了多種推薦系統(tǒng)算法加權累加,例如:FFM、SVM、LFM等。我個人建議以CF item based為主,一是因為算法成熟,便于實現(xiàn),二是user 數(shù)目遠大于 item 數(shù)目,user based 很難以對用戶進行歸類。

做相似度分析第一步:Item畫像設計,其遵循的原則為提煉出那些易于區(qū)分不同Item的顯著性特征或標簽。這一步需要做詳盡性分析,不做討論。

轉而思考計算相似度時, 除了在本身item標簽內(nèi)容中計算相似距離,我們還需要考慮什么場景?什么特殊因子?

1、冷啟動場景:

通常在新用戶進入系統(tǒng)時,沒有數(shù)據(jù)來源導致冷啟動問題,大多數(shù)網(wǎng)站采取主動選擇標簽功能,進行標簽相關內(nèi)容推送:

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

2、推薦不是“推送”,不同用戶的首頁流推薦

首頁的好文推薦是產(chǎn)品引流最重要的窗口,可是過度推送好文會影響部分產(chǎn)品用戶的用戶體驗,從而影響轉化率。如果根據(jù)不同用戶使用場景決定首頁流中好文的推送條數(shù),可能效果會好一些。例如用戶停留時間和用戶日均瀏覽數(shù)來作為不同參數(shù),確定權重W ,計算評分R

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

根據(jù)評分 R 的不同,來確定首頁流的推薦數(shù)目。

3、多次重復推送同一品類文章:多樣性問題

用戶在內(nèi)容平臺所希望收獲的文章一定是多樣的,如果在較長時間跨度里推薦系統(tǒng)只能覆蓋單一興趣點,那這個推薦列表在長期評估時一定是無法讓用戶滿意的。

那也就是說,我們在推薦系數(shù)時,必要考慮一個因子來控制多樣性問題,如果當系統(tǒng)想推薦文章i時,我們就要對已經(jīng)在文章列表R(u)內(nèi)任意文章 j ,計算相似度,引入

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

如果系統(tǒng)的推薦分布頻次,可以和用戶點擊頻次掛鉤,那結果就完全符合多樣性要求了。

4、熱門內(nèi)容更熱,冷門內(nèi)容依然無人問津:馬太效應

馬太效應在UGC平臺是常見的,通常體現(xiàn)在用戶瀏覽參與集中于的熱門文章中,大部分內(nèi)容的參與度極低,也可以稱為覆蓋率問題。覆蓋率可以描述一個推薦系統(tǒng)對于文章推薦效果長尾能力的發(fā)掘,指推薦文章占全部內(nèi)容的占比,可以用信息熵度量。

作為整個UGC平臺的管理方,站方有責任讓所有優(yōu)質的UGC內(nèi)容受到關注,而并非只有熱門內(nèi)容,只有克服馬太效應,這樣才能夠讓發(fā)帖用戶感受到更多的關注度,鼓勵激發(fā)更多的優(yōu)質內(nèi)容。

加入一個因子懲罰熱門權重

什么值得買推薦系統(tǒng)思考 桂林網(wǎng)絡推廣多少錢

5、產(chǎn)品鏈層次因素

回想在本文開篇處提出的問題:用戶在好價內(nèi)搜索“軟毛牙刷”,那好文系統(tǒng)應該推送的是“牙刷測評”還是關聯(lián)”口腔健康“商品的文章呢?

宏觀來看,所有品類的商品都存在產(chǎn)品鏈上下層的關系。買了iphone X的人可能對于手機殼感興趣,想買普通牙刷的人可能就是漱口水、電動牙刷的潛在消費者。沒有一項產(chǎn)品是單獨存在的,既然我們要做的是提高用戶消費觀念,那推薦系統(tǒng)是不是該偏向推送更深層次的內(nèi)容,加大權重。

6、買過的產(chǎn)品還要推送嗎?

當我們已知用戶購買過產(chǎn)品后,我們是否應該再次推送相關內(nèi)容呢? 這個時候我們需要判斷商品的消耗性、周期性、以及是否高話題性。這都關乎著是否再次推送內(nèi)容,什么時候再推送內(nèi)容。但是具體情況太多,就不做算法推導了。

說一個很有趣的現(xiàn)象,淘寶的推薦系統(tǒng)工程師做過實驗,點擊率最高的推薦項目是用戶剛剛搜過,剛剛完成購買的商品。但是重復推送內(nèi)容,這是一個好的推薦系統(tǒng)該做的嗎?團隊目的到底是什么:推薦系統(tǒng)點擊率高?提供用戶感興趣的內(nèi)容?KpI ?不同目的可能導致結果相差萬千。

7、實時性

實時性主要是要求推薦系統(tǒng)在分鐘級/秒級完成數(shù)據(jù)分析,作出預判,并且對其作出操作。這個問題主要面對的是技術性問題,因為許多網(wǎng)站的推薦系統(tǒng)都是以天為單位進行日志讀取操作,再完成推薦動作。而如果要完成實時操作,就只能簡化推薦系統(tǒng)算法,例如 對于User-Item行為矩陣進行擴充動作簡化預測過程。

需要根據(jù)場景采納不同的推薦模式,好文內(nèi)容可能更適合離線式方法。

后記

其實基于值得買推薦系統(tǒng),XgBoost 與Factorization Machine (最新的FFM)都可能有不錯的效果,但是本文討論以場景為出發(fā)點,不討論算法具體內(nèi)容,而且業(yè)界大多數(shù)都認可一個觀點,即在推薦系統(tǒng)中:UI > 數(shù)據(jù) > 算法,如果讓用戶接納,并覺得懂得其心,這才是最關鍵的一點。

pS:寫文章時正逢年節(jié),喝酒誤事,思路斷斷續(xù)續(xù)。前后內(nèi)容繁雜,一人之力遠無法考慮周全,只做簡單思考,學習總結之用。

始發(fā)于簡書:周CC君

<script>document.writeln('

相關推薦

更多新聞

主站蜘蛛池模板: 亚洲精品无码久久久影院相关影片| 国产成人av免费网址| 亚洲人成网77777色在线播放| 女人下边被添全过视频| 色偷偷av男人的天堂| 久久99国产精品久久99| 欧美丰满熟妇bbb久久久| 午夜一区欧美二区高清三区| 国产思思99re99在线观看| 香港经典a毛片免费观看hd| 国精产品推荐视频| 国产成人精品a视频| 精品久久久久中文字幕一区| 18禁超污无遮挡无码免费游戏| 午夜性爽快| 免费观看交性大片| 亚洲国产天堂久久综合226114| 日韩欧美在线综合网| 国产精品任我爽爆在线播放| 欧洲美女粗暴牲交免费观看| 国模无码视频一区| 国产精品亚洲а∨无码播放| 人妻少妇偷人精品无码| 丁香六月久久婷婷开心| 亚洲日本欧美日韩中文字幕| 麻豆一区二区在我观看| 在线观看av永久免费| 可以直接看的无码av| 四虎影视免费永久在线观看| 亚洲欧美综合精品二区| a级毛片免费网站| 精品乱码久久久久久中文字幕| 国产精品视频一区二区三区无码 | 在线高清理伦片a| 无码国内精品人妻少妇蜜桃视频| 无码任你躁久久久久久老妇| 国精产品一区一区三区有限在线| 欧美性巨大╳╳╳╳╳高跟鞋| 久久久久亚洲av无码专区体验| 精品国模一区二区三区| 亚洲精品美女久久7777777|